АВТОМАТИЧЕСКОЕ РАСПОЗНАВАНИЕ РЕЧИ В УСЛОВИЯХ ШУМА МУЗЫКИ НА МНОГОКАНАЛЬНЫХ ЗАПИСЯХ С УДАЛЕННОГО МИКРОФОНА
Аннотация:
Предмет исследования. Рассмотрен метод подавления шума музыки в многоканальной записи речевого сигнала, основанный на оценке шумовой маски акустической моделью. Метод применяется для реализации автоматического распознавания речи в условиях шума музыки. Методы. Исследование выполнено с использованием акустической модели, реализованной на искусственных нейронных сетях, и натурных записей, сделанных в условиях реверберации. Основные результаты. Акустическая модель способна оценивать шумовую маску на многоканальной смеси для различных жанров музыки. Применение подобной маски для оценки ковариационной матрицы в алгоритме нацеливания MVDR (Minimum Variance Distortionless Response) способствует повышению точности распознавания речи минимум на 4,9 % на отрезке значений отношения сигнал-шум 10–30 дБ. Практическая значимость. Метод оценки параметров алгоритма MVDR на основе оценки шумовой маски акустической моделью способствует подавлению нестационарного шума, такого как шум музыки, что увеличивает робастность систем автоматического распознавания речи.
Ключевые слова:
Постоянный URL
Статьи в номере
- НИЗКОКОГЕРЕНТНАЯ РЕФЛЕКТОМЕТРИЯ ФЛУОРЕСЦИРУЮЩИХ СЛУЧАЙНО-НЕОДНОРОДНЫХ СРЕД
- МОДЕЛИРОВАНИЕ ИНТЕГРАЛЬНО-ОПТИЧЕСКОЙ РЕАЛИЗАЦИИ КВАНТОВОГО АЛГОРИТМА ПОИСКА
- ПРИМЕНЕНИЕ ИК СПЕКТРОСКОПИИ И МУЛЬТИВАРИАНТНОГО АНАЛИЗА К ИССЛЕДОВАНИЮ СЫВОРОТОК КРОВИ ПАЦИЕНТОВ, БОЛЬНЫХ ЭПИЛЕПСИЕЙ
- МЕТОД ПОИСКА ИЗМЕНЕНИЙ СОСТОЯНИЯ ЗЕМНОЙ ПОВЕРХНОСТИ ПО РАЗНОВРЕМЕННЫМ КОСМИЧЕСКИМ СНИМКАМ
- МИКРОСТРУКТУРИРОВАНИЕ ПОВЕРХНОСТИ КРЕМНИЯ ПРИ ОДНОКРАТНОМ ОБЛУЧЕНИИ СДВОЕННЫМ ФЕМТОСЕКУНДНЫМ ЛАЗЕРНЫМ ИМПУЛЬСОМ
- МОДИФИЦИРОВАННЫЙ АЛГОРИТМ БЭКСТЕППИНГА ДЛЯ УПРАВЛЕНИЯ НЕЛИНЕЙНЫМИ МНОГОКАНАЛЬНЫМИ ОБЪЕКТАМИ C ПЕРЕКРЕСТНЫМИ СВЯЗЯМИ
- СРАВНЕНИЕ ОЦЕНОК НЕИЗВЕСТНЫХ ПАРАМЕТРОВ МЕТОДОМ ДИНАМИЧЕСКОГО РАСШИРЕНИЯ РЕГРЕССОРА И МЕТОДОМ НАИМЕНЬШИХ КВАДРАТОВ ПРИ НАЛИЧИИ ПОМЕХ ИЗМЕРЕНИЯ
- ВЛИЯНИЕ СУЛЬФАТА АММОНИЯ НА ХАРАКТЕРИСТИКИ НАНОПОРОШКОВ И ОПТИЧЕСКОЙ КЕРАМИКИ YAG:Yb
- УСИЛЕНИЕ ФОТОЛЮМИНЕСЦЕНЦИИ ИОНОВ Eu3+ В НАТРИЕВО-АЛЮМОСИЛИКАТНОМ СТЕКЛЕ МОЛЕКУЛЯРНЫМИ КЛАСТЕРАМИ СЕРЕБРА, СФОРМИРОВАННЫМИ МЕТОДОМ Na+-Ag+ ИОННОГО ОБМЕНА
- МОДЕЛИРОВАНИЕ ЭЛЕКТРОННОЙ СТРУКТУРЫ ZnO ИЗ ПЕРВЫХ ПРИНЦИПОВ С ИСПОЛЬЗОВАНИЕМ МОДИФИЦИРОВАННЫХ ФУНКЦИОНАЛОВ
- РАЗРАБОТКА АДАПТИВНОГО МОДУЛЯ СОЗДАНИЯ И ИССЛЕДОВАНИЯ ВИРТУАЛЬНЫХ МОДЕЛЕЙ ОБЪЕКТОВ ОКРУЖАЮЩЕЙ СРЕДЫ
- ОЦЕНКА ДЛИНЫ ПЕРИОДА НЕСТАЦИОНАРНЫХ ПРОЦЕССОВ В ОБЛАЧНЫХ СИСТЕМАХ
- АДАПТИВНОЕ ТРЕХМЕРНОЕ КОСИНУСНОЕ ПРЕОБРАЗОВАНИЕ ТРАНСПОРТНЫХ СЮЖЕТОВ
- ОБРАБОТКА СИГНАЛЬНОЙ ИНФОРМАЦИИ В ЗАДАЧАХ МОНИТОРИНГА ИНФОРМАЦИОННОЙ БЕЗОПАСНОСТИ АВТОНОМНЫХ ОБЪЕКТОВ БЕСПИЛОТНЫХ СИСТЕМ
- ИНТЕЛЛЕКТУАЛЬНАЯ СИСТЕМА ПОМОЩИ ТУРИСТУ: СЕРВИС-ОРИЕНТИРОВАННАЯ АРХИТЕКТУРА И РЕАЛИЗАЦИЯ
- АВТОМАТИЧЕСКАЯ НАСТРОЙКА ГИПЕРПАРАМЕТРОВ АЛГОРИТМОВ КЛАСТЕРИЗАЦИИ С ПОМОЩЬЮ ОБУЧЕНИЯ С ПОДКРЕПЛЕНИЕМ
- ПАРАМЕТРИЧЕСКАЯ ОПТИМИЗАЦИЯ ЦИФРОВЫХ ИНТЕГРАЛЬНЫХ СХЕМ ДЛЯ МИКРОМЕХАНИЧЕСКИХ ДАТЧИКОВ
- ТЕХНОЛОГИЧЕСКИ ОРИЕНТИРОВАННЫЙ СИНТЕЗ АНАЛОГО-ЦИФРОВЫХ ПРЕОБРАЗОВАТЕЛЕЙ ПОСЛЕДОВАТЕЛЬНОГО ПРИБЛИЖЕНИЯ ДЛЯ ИНТЕГРАЛЬНЫХ СХЕМ
- 3D-МОДЕЛИРОВАНИЕ ЧУВСТВИТЕЛЬНЫХ ЭЛЕМЕНТОВ ВОЛНОВОГО ТВЕРДОТЕЛЬНОГО ГИРОСКОПА И МАЯТНИКОВОГО АКСЕЛЕРОМЕТРА ИЗ КВАРЦЕВОГО СТЕКЛА
- ТЕПЛОВОЙ РЕЖИМ ИСТОЧНИКА УЛЬТРАХОЛОДНЫХ НЕЙТРОНОВ НА РЕАКТОРЕ ВВР-М
- АНАЛИЗ ВЛИЯНИЯ РАЗЛИЧНОЙ РАЗМЕРНОСТИ ФИЛЬТРОВ СВЕРТОЧНОГО СЛОЯ НА ТОЧНОСТЬ КЛАССИФИКАЦИИ ДОРОЖНЫХ ЗНАКОВ
- ИНФОРМАЦИОННАЯ ПОДДЕРЖКА ПРИНЯТИЯ РЕШЕНИЯ В СИСТЕМАХ АВТОМАТИЗИРОВАННОГО НАДЕЖНОСТНО-ОРИЕНТИРОВАННОГО ПРОЕКТИРОВАНИЯ
- АДДИТИВНЫЕ ТЕХНОЛОГИИ ПРИ СОЗДАНИИ АППАРАТУРЫ ВНУТРИКОРАБЕЛЬНОЙ СВЯЗИ
- РЕЦЕНЗИЯ НА СОБРАНИЕ НАУЧНЫХ ТРУДОВ ТЕРТЫЧНОГО-ДАУРИ В.Ю. ГАЛАМЕХ В ШЕСТИ ТОМАХ. ИЗД. ВТОРОЕ, ПЕРЕРАБОТАННОЕ И ДОПОЛНЕННОЕ